МІНІСТЕРСТВО ОСВІТИ І НАУКИ
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ „ЛЬВІВСЬКА ПОЛІТЕХНІКА”
Кафедра ІСМ
/
Звіт до лабораторної роботи №1
Проектування логічної структури сховища даних з архітектурою
Корпоративна фабрика.
Львів-2014р.
Тема бази даних: олімпійські ігри London 2012.
Мета: Вивчення порядку, методів та засобів проектування і побудови сховища даних з
корпоративною архітектурою та оцінка часу виконання запитів.
Теоретичні відомості
Парадигма для реляційних даних в сховищі даних (парадигма корпоративної інформаційної фабрики КІФ – Corporate Information Factory, CIF) розроблена Інмоном і передбачає, що дані повинні перебувати на низькому рівні ступені деталізації і в третій нормальній формі (3НФ, 3NF).
Після того, як дані такі формалізовані, важливо налаштувати їх для кожної групи користувачів та частково денормалізувати для пришвидшення виконання запиту.
Інмон вважає, що реляційна основа є достатньо гнучкою, щоб підтримувати багатовимірні вітрини даних і інші структури даних, як наприклад, сховища дослідження, бази даних, видобування даних.
Білл Інмон підтримує повторний або спіральний підхід до розвитку великого сховища даних. За цим підходом розвиток сховища відбувається ітераційно, тобто у разі виникнення потреби додається одна таблиця за один раз, що забезпечує лише незначну зміну схеми даних. Тому такий підхід до проектування сховища ще називають спіральним підходом..
У моделі Інмона, використовуючи повторний метод, помилки і внесення змін можуть стосуватись невеликої кількості даних, без необхідності повторно програмувати великі кількості даних у сховищі даних.
3НФ підхід дозволяє ґранулювати деталізовані та інтеґровані дані, забезпечивши максимальну гнучкість для опрацювання даних.
Білл Інмон також радить, щоб сховище даних містило корпоративно найвищий ґранульований рівень даних. Тоді структура і вміст сховища даних не підпорядковуватимуться вимогам будь-якого відділу, але натомість обслуговуватимуть вимоги корпорації.
Як відмітні характеристики підходу Білла Інмона до архітектури сховищ даних можна назвати наступні:
Використання реляційної моделі організації атомарних даних і просторової - для організації сумарних даних.
Використання ітеративного або «спірального» підходу при створенні більших сховищ даних, тобто «будівництво» сховища даних не відразу, а по частинах. Це дозволяє, при необхідності, вносити зміни в невеликі блоки даних або програмних кодів і рятує від необхідності перепрограмовувати значні обсяги даних у сховищі. Те ж саме можна сказати й про потенційні помилки: вони також будуть локалізовані в межах порівняно невеликого масиву без ризику зіпсувати все сховище.
Використання третьої нормальної форми для організації атомарних даних, що забезпечує високий ступінь детальності інтеґрованих даних і, відповідно, надає корпораціям широкі можливості для маніпулювання ними і зміни формату і способу подання даних у міру необхідності.
Сховище даних – це проект корпоративного масштабу, що охоплює всі відділи й обслуговує потреби всіх користувачів корпорації.
Сховище даних – це не механічна колекція вітрин даних, а фізично цілісний об'єкт.
Хід роботи
Перелік, опис та обґрунтування таблиць в сховищі даних:
Змагання – інформація про проведені змагання.
Вид спорту – назви видів спорту(бокс, плавання і т.д.)
Дисципліна – містить назви дисциплін.
Країни – інформація про країни.
Медаль – таблиця, яка вказую власника кожної медалі.
Спортсмени – містить основну інформацію про спортсменів, які завоювали медалі.
Люди - містить інформацію(прізвище, номер країни) про людей(спортсменіві тренерів), які причетні до завойованих медалей.
Стадіони – містить інформацію про ті стадіони чи зали, в яких проводилися змагання.
Тренери – основна інформація про тренерів, підопічні ...